Контексты употребления собраны по предложениям длиной от 4 до 6 токенов (включая финальный терминатор, если он есть). Затем получаем средний вектор фразы по w2v векторам слов, исключая само ключевое слово, и скармливаем все это в k-means
(
Read more... )